【第1天】前言 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2021 iThome 鐵人賽

DAY 1

1

AI & Data

手寫中文字之影像辨識系列第 1 篇

【第1天】前言

13th鐵人賽

2021-09-16 23:55:12

2470 瀏覽

分享至

背景

曾任職被動元件廠的品保工程師，鑒於以往資料分析無法滿足龐雜的資料與客戶端需求，希望培養資料洞察力與建模預測能力，到資策會AI/Big Data資料分析班進修，初步認識這個領域。
在進修期間確立了往資料科學發展的想法，在朋友的推薦下，開始到Kaggle Playground Competitions尋找有興趣的主題(主要是影像辨識)，參考前輩們的解題邏輯自己摸索。
目前程度大約是：觀察資料集與確定目標後(ex.多元影像分類)，可以自己安排資料清洗方式與模型訓練流程，及嘗試可能的模型優化方法。
「一個好的工程師，必須有自己的Side projects。可以是磨練新技術，或是解決生活中遇到的問題」。因此，我找了以前的夥伴組隊報名2021年的玉山人工智慧挑戰賽，才有了這系列的文章。

參賽契機

玉山人工智慧挑戰賽結束後，想找時間彙整競賽歷程和學習成果，但總是提不起勁。頻繁使用阿Q的精神勝利法安慰自己：「工作太忙、假日要適度休息...」，就這樣延宕了3個月。恰逢iThome鐵人賽，需要連續30天寫作分享，故把握這次機會，強迫自己走出舒適圈。
從一開始接觸Deep learning影像辨識，追隨前輩們步伐的懵懂前行，到伙伴們合力完成玉山AI競賽。藉由此次的沉澱，跟大家分享中文字辨識可能遇到的問題與解決方式，希望可以拋磚引玉、教學相長。

主題介紹

名稱：玉山人工智慧挑戰賽2021夏季賽-中文手寫影像辨識
期間：4/12/2021-6/18/2021
內容:
- 主辦單位提供約七萬張手寫中文字圖檔，每個圖檔命名對應該中文字。參賽者透過CV演算法，精準辨識圖片內手寫文字。
- 需要辨識的中文字共有800個，當該圖檔文字「無法辨識」或「不屬於800字的任何一類」，須判定為isnull(其他類別)。
- 需要將訓練好的模型打包，在Google Cloud Platform部屬API Server，提供手寫中文字辨識服務。

小結

第1天的前情提要到此告一段落，接下來準備踏入影像辨識的領域。
請大家多指教，有任何問題或建議，歡迎留言討論。
由於撰文時間緊湊，實作的完整程式碼，會緩慢更新到GitHub上，請多見諒。

【第2天】開賽準備

系列文

手寫中文字之影像辨識共 31 篇

目錄

RSS系列文訂閱系列文

15 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙